import jieba
import sys
import pickle

if __name__ == '__main__':

    text = """
    Beauty Buffet 牛奶洗面奶
泰国Beauty Buffet Q10牛奶洗面奶100g
老爸推荐 - 不紧绷不起皮好评满满的氨基酸洁面膏/洗面奶
【法国原装进口】法国Lancome兰蔻 洗面奶女士 臻白净透洁面 智能愉悦臻白洁面泡沫/泡沫洗面奶125ml
【东方优选】特价抢购泰国BeautyBuffet Q10牛奶洗面奶2瓶装 59元 洗面奶+沐浴露79元~全国包邮（新疆、西藏、青海、甘肃、内蒙除外）
像水果一样香脆的新鲜青皮核桃29.9元5斤装全国包邮（除偏远地区）送开核桃工具和手套，无农药无化肥纯天然食物健康美味
保健水果 养生之桃 【 炎陵黄桃  肉嫩多汁  软中带硬  甜多酸少 桃子界中上帝的宠儿】
【一区】越南去黑头粉刺面膜撕拉式正品进口绿茶纯植物面膜粉清洁毛孔男女
9.8斤！【最超值尾货】蚕丝抗菌防螨子母被 一厚一薄 两条被子
【好的睡眠来自一款被子】超舒服~出口美国高品质夏季多彩民族风印花空调凉被，可机洗、水洗
【反季大促】正宗新疆长绒棉 各规格被子床垫 新疆石河子定做直发 全国包邮
【油多拉影像生活】手机高清30倍微距镜头
自由幻想手游充值 手机版代充 （苹果IOS版本）
充电神器 手机通用无线充电器 含手机接口
江湖召集令！千军万马来相应！持续火爆中！地表最强纳米黑科技s*premexFL*UR1SH联名随手贴手机万能支架
单手取放丨重力感应手机支架，稳定牢固不挡视野，开车导航必备
官网充值晋江文学城晋江币APP手机版可用 自动充值
【降温12度 阻挡99%紫外线】超轻+超小设计 仅17cm 拒水不沾雨  超轻凉感5折太阳伞
超轻迷你口袋防晒 太阳伞【D】（现货不多）
五折超轻迷你胶囊太阳伞 晴雨两用upf50+
【火爆日本】裸感0压，无痕蕾丝性感美背文胸，无钢圈0束缚，超薄透气，清凉舒适，裸睡般的睡眠文胸
推荐：买一送一【火爆日本】裸感0压，无痕蕾丝性感美背文胸（限量赠品，粉丝快抢！！！）
2件特惠疯抢！【火爆日本，性感到让男人流鼻血的比基尼文胸】超裸感零压，24小时清凉透气，专治一种病叫：“夏天不想穿内衣！”
5折特惠疯抢！【火爆日本】比裸睡还舒服的无痕内衣，无钢圈，超轻薄，罩杯1秒从A到C，穿上真的会呼吸！Vanvene正品呼吸文胸
| 85元3条，比面膜还薄的内裤，告别瘙痒异味 | 火爆日本的“面膜内裤”，2小时速干，送女友必备
推荐：卖断货的艾绒坐垫和枕头，终于来啦！坐着躺着能养生，助眠安神、温经散寒、通经活血、养生最佳选择！
吃得起鲍鱼不是梦~ 咪表麻辣鲍鱼
咪一口表停下来~咪表 辣香小黄鱼
最对得起你的胃~咪表辣卤对虾
甬城辣卤界网红~咪表辣卤龙虾尾
国民冰醉小龙虾~咪表五粮液熟醉小龙虾
极力推荐！巨舒适！ ins闺蜜装！！简约冷淡风复古系腰带短袖连衣裙
【秒变短裤】Pelliot二合一透气防水速干裤（送腰带）
【高档水果】百香果（紫色袋）4个
【新品】黄瓶新品上市红绿不变 沙拉瓶子 Salad Bottle 木瓜南瓜百香果沙拉
永璞|冷萃咖啡液2袋组合 原创液体咖啡COLD BREW 20包入 （顺丰包邮）
小大师茶手提袋(半斤装)/0.9元一个/整捆50个/300个包邮
知音（1斤）毛尖手提袋/1.2元1条/整捆50条/60元.300条起包邮
满口鲜货，吃到扶墙出！仅168元/4人抢原价342元泰香茅火锅套餐！海鲜+肉类+蔬菜~泰式经典锅底+蘸料~分量超足，环境好到爆！
吃火锅的KTV就是佰迪乐
留一桌｜超值4人火锅套餐（含锅底）
大东波点童鞋儿童凉鞋2018新款女童公主鞋夏季韩版沙滩鞋防滑软底DT18X1252A
F516 特价清仓 独家原单 女神在哪里？欧美一线原单铆钉夏款平跟凉鞋
费儿的王子 Fiona’s Prince 艺术大师系列儿童真皮凉鞋，nappa 牛皮手工制作平底包头鞋，舒适透气
59元包邮限时抢！意尔康专柜正品纯牛皮男沙滩凉鞋5413FS89302A
原厂单】给家里小公主囤货吧 Q弹十足 小马宝莉 便利一脚蹬凉鞋/果冻鞋
大东童鞋儿童凉鞋牛皮2018新款中大童男童沙滩鞋夏季防滑软底露趾
【五双特惠】绝不掉跟！ 绝对隐形！任意剪也不脱丝！男士女士冰丝凉感船袜，全能夏日高跟凉鞋必备，防滑、隐形、防菌、防臭！
ROCKY BEAR洛克熊凉鞋【付款后3天发货】
费儿的王子 Fiona’s Prince 小女生花朵系列玛格丽特小花公主凉鞋，可爱时尚魔术贴款，精选牛皮手工制作包头凉鞋，橡胶鞋底防滑设计，舒适透气
59元包邮！意尔康女款PU凉鞋6451ZL29711U
新款儿童泳衣外套分体裙式数字图案韩国女孩三件套公主学生泳装
大容量新款双肩包
正品龙骧！经典推荐！史上颜色最全！NEO加厚双肩包男女通用~W062903
最新经典款双肩包 15.6英寸时尚背包 商务休闲电脑包*黑色
最新经典款双肩包 15.6英寸时尚背包 商务休闲电脑包*黑色
URG 2.0 专业跑步袜子 运动防臭透气马拉松越野
C11571！高定款！低高帮针织套脚男款袜子鞋！
22221  睡眠袜，女人必备的袜子，尤其是夏季空调房！产后孕妈，中老年妈妈，小仙女都要有！
老爸推荐--无APEO 男女儿童袜子 夏季移圈袜 5双装
加厚有盖内衣收纳盒文胸内裤袜子抽屉塑料收纳箱桌面整理盒
门店自提芒果干
芒果TV会员充值/下单后联系在线客服领取激活码
霸气十足！不怒自威！！这是一款无可挑剔的腰带！！！市面罕见的代工厂版本 ！元厂元料！！GUcc1老虎头腰带/皮带！
F614 特价清仓  年对最超值的皮带合集 没有之一 全部都是铁盒包装 3个牌子齐发
USB风扇 充电宝 小夜灯 三合一手持迷你桌面小风扇
USB 迷你风扇  静音大风力 办公家用电脑桌夏日必备神器 可接移动电源 30天包退换
【明星同款】素乐N9新品usb风扇手持
【无线便捷 香薰除臭】德尔玛小风扇 usb迷你静音 可充电 1档续航3小时
【蜗牛风扇】团长0元包邮试用，快去喊好友助力吧！
果壳Tee | 树叶收藏家 博物学家的衣柜纯棉黄色圆领短袖T恤 男女款
［有赞拼团］韩式马卡龙色空气清新剂室内衣柜香薰盒82.5g
衣柜空间专家神奇魔术折叠伸缩多功能衣架家用收纳神器多层晾衣撑
【梅雨季，衣服不倒“霉”】可挂式樟脑盒 挂式衣物除湿樟脑盒去味干燥剂衣柜衣橱防潮防霉樟脑丸
泰国 mistine雪花冰点防晒霜SPF50 身体防晒乳 100ml
G家Bosco狗狗钱包
超值 秒杀 迅峰鳄鱼纹真牛皮手拿钱包
男士经典的首选！震心给力，纯手工牪皮编织  男士高端大手包 钱包
【最高版本！！超值三件套】M*M 新款复古印花logo马鞍包邮差包 超值三件套 包包+兔子镜子+小钱包
【长款钱包】团长0元包邮试用，快去喊好友助力吧！
【三区】钛钢彩金项链女chic黑天鹅锁骨链网红韩版简约韩国学生森系
科学知饰丨眼花鸟乱 火烈鸟 巨嘴鸟 玄凤鹦鹉 欧亚鸲 缤纷鸟类饰品 项链手链戒指耳环耳线
雪完美PXE瓜菜水红葡萄酒多酚面膜3+2片 补水保湿面膜贴正品夏
国婚纱面膜二代 超薄补水保湿滋润 5片装

    """
    # count_vector_file = sys.argv[1]
    # tfidf_file = sys.argv[2]
    # lg_file = sys.argv[3]

    classes = """
    19 | 光盘光碟磁卡类
20 | 办公⽂文具
21 | 图书
22 | 多媒体图书
23 | 五⾦金金与⼯工具
24 | ⼉儿童/青少年年家具
25 | 其它
26 | 卫浴洁具
27 | 厨房
28 | 坐具/沙发/坐垫类
29 | 家装建材/五⾦金金/涂料
30 | 床/床垫类
31 | 床上⽤用品
32 | 挂饰/镜⼦子/家装⼯工艺摆设类
33 | 桌/茶茶⼏几/柜类
34 | ⽑毛⼱巾/浴⼱巾/浴袍/家居服
35 | 物品套/罩类
36 | 窗帘/窗纱/⻔门帘类
37 | 箱架类
38 | 酒具
39 | 闹钟/挂钟/计时器
40 | MP3/MP4/录⾳音笔/收⾳音机
41 | 专业⾳音频设备
42 | 体感⻋车/独轮⻋车/其它体感
43 | 单反/单电相机配件
44 | 家庭影院/CD机/DVD机/组合⾳音响
45 | ⼿手机通讯
46 | ⼿手机配件
47 | 数码周边
48 | 智能穿戴/眼镜/硬件周边
49 | 其它
50 | 化妆⼯工具
51 | 唇部护理理
52 | 头发/造型
53 | 彩妆
54 | ⼿手⾜足护理理
55 | 洗发护发
56 | 男⼠士护理理
57 | 眼部护理理
58 | 精油/芳疗
59 | ⾝身体护理理
60 | ⾯面部护理理
61 | ⾯面部洗护⼯工具
62 | 香⽔水
63 | 个⼈人洗护
64 | 健康监测仪器
65 | 创意/节庆⽤用品/礼品
66 | 卫浴⽤用品
67 | 家居⽇日⽤用品
68 | 情趣⽤用品/计⽣生⽤用品
69 | 收纳整理理
70 | 清洁⽇日化
71 | 餐厨⽤用品
72 | ⼉儿童内衣裤/睡衣/配饰
73 | 其它玩具
74 | 婴幼⼉儿奶粉/⽜牛初乳/维⽣生素/婴幼⼉儿营养品 
75 | 婴幼⼉儿护肤品
76 | 婴童⽂文具⽤用品/⼉儿童书包
77 | 孕妇营养
78 | 孕妈服饰
79 | 孕妈⽤用品
80 | 幼⼉儿响铃/布书⼿手偶/爬⾏行行健⾝身
81 | 床品/抱被/⽑毛毯/枕头类
82 | 彩泥/⼿手⼯工制作/仿真/过家家玩具
83 | 戏⽔水玩具/洗澡⽤用品
84 | 早教/⾳音乐/智能玩具
85 | 果泥/米粉/婴幼⼉儿辅食
86 | ⽔水杯/哺喂相关
87 | 消毒/吸奶器/⼩小家电
88 | 电动/遥控/惯性/发条玩具
89 | 积⽊木/拆装/串串珠/拼图/配对玩具
90 | 童床/餐椅
91 | 童装/婴⼉儿装
92 | 童⻋车/安全座椅/⼿手推⻋车/出⾏行行⽤用品
93 | 童鞋/婴⼉儿鞋
94 | 纸尿尿裤/纸尿尿片/拉拉裤/布尿尿布/隔尿尿垫类 
95 | 摩托⻋车/电动⻋车/助动⻋车/其它整⻋车
96 | 汽⻋车配件
97 | 汽⻋车内饰
98 | 汽⻋车外饰
99 | 汽⻋车电⼦子
100 | ⼿手表
101 | 时尚饰品
102 | 有机宝⽯石/彩⾊色宝⽯石 
103 | 烟具
104 | 眼镜配件/⼯工具/护理理剂 
105 | 翡翠/⽟玉⽯石/佛珠等
106 | ⾦金金银饰品
107 | 钻⽯石
108 | 丽⼈人健⾝身
109 | 休闲娱乐
110 | 保险
111 | 充值/代办
112 | 医疗健康
113 | 卡券/票务
114 | 婚庆摄影
115 | 宠物服务
116 | 家政服务
117 | 教育/培训/咨询
118 | 旅⾏行行
119 | 汽⻋车养护
120 | 蛋糕/鲜花
121 | 酒店客栈
122 | 餐饮外卖
123 | 个⼈人护理理/美容/健康 
124 | 保健/按摩器材
125 | 办公设备/⽂文仪 
126 | 厨房电器
127 | ⼤大家电/家电配件 
128 | 平板电脑配件 
129 | ⽣生活⼩小家电
130 | 电脑/平板电脑
131 | 电脑/笔记本配件
132 | 围⼱巾/⼿手套/帽⼦子
133 | 套装
134 | 女⼠士上装
135 | 女⼠士内衣/⽂文胸/内裤
136 | 女⼠士裙装
137 | 女⼠士裤装
138 | 婚纱/礼服/旗袍
139 | 家居服/睡衣/睡袍
140 | 男⼠士上装
141 | 男⼠士内衣/内裤
142 | 男⼠士裤装
143 | 腰带/领带/领结
144 | 袜品
145 | 乐器及乐器配件
146 | 其它
147 | 其它宠物/动物及⽤用品
148 | 园艺⽤用品
149 | 字画书法类
150 | 宠物服饰及配件
151 | 宠物零食
152 | ⽔水族世界
153 | 猫狗及玩具⽤用品
154 | 花类
155 | ⻦鸟类及⽤用品
156 | 户外包/登⼭山包/旅⾏行行包
157 | 户外服装配饰
158 | 户外露营/野炊装备
159 | ⽔水上运动/冰上/滑雪运动相关
160 | 球类相关
161 | 瑜伽等其它
162 | ⾃自⾏行行⻋车/滑板/跑步机/健⾝身器械类
163 | 防护/救⽣生设备
164 | 功能箱包
165 | 包
166 | 女鞋
167 | 男鞋
168 | 老⼈人鞋
169 | 钱包/卡包/钥匙包/零钱包/其它⼩小包 
170 | 坚果/炒货
171 | ⼲干货
172 | 新鲜⽔水果
173 | 新鲜蔬菜
174 | 新鲜蛋类
175 | 果⼲干/蜜饯/果脯
176 | 海海产/⽔水产
177 | ⽣生⾁肉/⾁肉制品
178 | 米类
179 | 糖果/果冻/巧克⼒力力
180 | 罐头/速食类
181 | ⾁肉类零食
182 | 膨化等其它零食
183 | 茶茶
184 | 营养品/保养品
185 | ⾖豆类/⾖豆制品
186 | 酒类
187 | 食⽤用油/调味/烘培原料
188 | 饮料/冷饮/果汁/⽜牛奶制品/冲泡类饮料 
189 | 饼⼲干蛋糕
3804 | 垂钓⽤用品
3901 | 情侣装
3910 | 桌游棋牌类 
3914 | 汽⻋车清洁 
3916 | 安防类
3927 | 军迷⽤用品 
3929 | ⺠民俗⽂文化 
3931 | 媒体订阅服务 
3934 | 蛋糕
3935 | 鲜花 
3936 | 香烟
    """

    count_vector_file = '/Users/hardy/data/models/cv20_all.pkl'
    tfidf_file = '/Users/hardy/data/models/tfidf20_all.pkl'
    lg_file = '/Users/hardy/data/models/lg20_all.pkl'

    CV = pickle.load(open(count_vector_file, 'rb'))
    TFIDF = pickle.load(open(tfidf_file, 'rb'))
    LG = pickle.load(open(lg_file, 'rb'))

    class_dict = dict()
    for l in classes.split('\n'):
        d = l.strip().split('|')
        if len(d) == 2:
            class_dict[d[0].strip()] = d[1].strip()

    for l in text.split('\n'):
        if not l.strip():
            continue
        seg = jieba.lcut(l)

        c = LG.predict(TFIDF.transform(CV.transform([' '.join(seg)])))
        prob = dict(zip(LG.classes_, LG.predict_proba(TFIDF.transform(CV.transform([' '.join(seg)])))[0]))[c[0]]
        t = class_dict.get(c[0])
        print(t, c[0], prob, l)

